知识图本质上是不完整的。因此,大量研究是针对知识图完成(KGC)的,即,从知识图(KG)中表示的信息中预测了丢失的三元组。嵌入模型已经为KGC产生了有希望的结果,但是当前的KGC嵌入模型都无法:(1)完全捕获重要的推理模式(例如组成),(2)共同捕获突出的逻辑规则(例如,层次结构和组成),以及(3)提供捕获模式的直观解释。在这项工作中,我们提出了表达式,这是一种完全表达的空间功能嵌入模型,可以同时解决所有这些挑战。表达式将成对的实体作为点和关系作为虚拟三重空间$ \ mathbb {r}^{2d} $中的超平行平行四边形。该模型设计不仅可以共同捕获一组丰富的推理模式,而且还可以通过超平行平行四边形的空间关系来显示任何受支持的推理模式,从而提供表达嵌入及其捕获模式的直观且一致的几何解释。标准KGC基准测试的实验结果表明,表达性与最先进的模型具有竞争力,甚至在WN18RR上的表现明显优于它们。
translated by 谷歌翻译
Datalog^e是具有生存量化的数据扩展。尽管它的高表达能力是由简单的语法和对完整递归的支持支撑的,但它特别适合于现代化的知识图上的现代应用,但对这种语言的查询答案(QA)通常是不可确定的。因此,已经出现了不同的片段,将句法局限性引入了数据词,这在其表达能力和质量检查的计算复杂性之间取得了平衡,以实现可决定性。在这篇简短的论文中,我们专注于两个有前途的可访问候选人,分别是害羞和守望的数据+/-。对社区的明确兴趣做出反应,我们阐明了这些碎片之间的关系。此外,我们对实施害羞和守护的系统进行了实验分析,分别是DLV^e和Vadalog。
translated by 谷歌翻译
预测不确定性估计对于在现实世界自治系统中部署深层神经网络至关重要。但是,大多数成功的方法是计算密集型的。在这项工作中,我们试图在自主驾驶感知任务的背景下解决这些挑战。最近提出的确定性不确定性方法(DUM)只能部分满足其对复杂计算机视觉任务的可扩展性,这并不明显。在这项工作中,我们为高分辨率的语义分割推动了可扩展有效的DUM,它放松了Lipschitz约束通常会阻碍此类架构的实用性。我们通过利用在任意大小的可训练原型集上的区别最大化层来学习判别潜在空间。我们的方法在深层合奏,不确定性预测,图像分类,细分和单眼深度估计任务上取得了竞争成果。我们的代码可在https://github.com/ensta-u2is/ldu上找到
translated by 谷歌翻译
许多现实世界的识别问题都有不平衡或长尾标签的分布。这些分布使表示形式学习更具挑战性,因为对尾巴类别的概括有限。如果测试分布与训练分布有所不同,例如统一与长尾,需要解决分配转移的问题。为此,最近的作品通过贝叶斯定理的启发,使用边缘修改扩展了SoftMax跨凝结。在本文中,我们通过专家的平衡产品(Balpoe)概括了几种方法,该方法结合了一个具有不同测试时间目标分布的模型家庭,以解决数据中的不平衡。拟议的专家在一个阶段进行培训,无论是共同还是独立的,并无缝融合到Balpoe中。我们表明,Balpoe是Fisher的一致性,可以最大程度地减少均衡误差并执行广泛的实验以验证我们的方法的有效性。最后,我们研究了在这种情况下混合的效果,发现正则化是学习校准专家的关键要素。我们的实验表明,正则化的BALPOE在测试准确性和校准指标上的表现非常出色,从而导致CIFAR-100-LT,Imagenet-LT和Inaturalist-2018数据集的最新结果。该代码将在纸质接受后公开提供。
translated by 谷歌翻译
单眼深度在许多任务中很重要,例如3D重建和自动驾驶。基于深度学习的模型在该领域实现了最新的性能。估计单眼深度的一组新方法包括将回归任务转换为分类。但是,对于社区中回归(CAR)的分类方法缺乏详细的描述和比较,并且没有深入探索其不确定性估计的潜力。为此,本文将介绍汽车方法的分类法和摘要,对汽车的新不确定性估计解决方案以及对Kitti数据集中基于汽车模型的深度准确性和不确定性量化的一组实验。实验反映了两个骨干上各种CAR方法的可移植性的差异。同时,新提出的不确定性估计方法只能用一个正向传播胜过结合方法。
translated by 谷歌翻译
场景文本检测的具有挑战性的领域需要复杂的数据注释,这是耗时和昂贵的。弱监管等技术可以减少所需的数据量。本文提出了一种薄弱的现场文本检测监控方法,这是利用加强学习(RL)。RL代理收到的奖励由神经网络估算,而不是从地面真理标签推断出来。首先,我们增强了具有多种培训优化的文本检测的现有监督RL方法,允许我们将性能差距缩放到基于回归的算法。然后,我们将拟议的系统在现实世界数据的漏洞和半监督培训中使用。我们的结果表明,在弱监督环境中培训是可行的。但是,我们发现在半监督设置中使用我们的模型,例如,将标记的合成数据与未经发布的实际数据相结合,产生最佳结果。
translated by 谷歌翻译
模具分析是一种必不可少的数字方法,以及古代经济史的重要工具。然而,手动模具研究过于劳动密集型,可以全面研究罗马帝国等大型币。我们通过提出无监督计算模具分析的模型来解决这个问题,这可以减少大规模模具研究所需的时间投资,在许多情况下从多年到几周内完成了几个数量级。从计算机视觉观点来看,DIE研究提出了一个挑战的无监督的聚类问题,因为它们涉及一个不明显的和大量的高度相似的语义类别的不平衡尺寸。我们通过确定从贝叶斯距离聚类框架中的专门设计的基于高斯进程的关键点特征的硬币面之间的硬币面之间的异常来解决这些问题。通过分析1135罗马银币在64-66 C.E中进行了分析来证明我们的方法的功效。
translated by 谷歌翻译
在本文中,我们介绍了ML-解码器,是一种基于新的关注的分类头。 ML-解码器通过查询预测类标签的存在,与全局平均池相比,能够更好地利用空间数据。通过重新设计解码器架构,并使用新颖的组解码方案,ML-Decoder是高效的,并且可以缩放到数千个类。与使用较大的骨架相比,ML-解码器一致地提供更好的速度准确性权衡。 ML-Decoder也是多功能的 - 它可以用作各种分类头的替代品,并在用Word查询操作时概括到未经看的类。新型查询增强进一步提高了其泛化能力。使用ML-Decoder,我们实现了最先进的结果:在MS-Coco多标签上,我们达到91.4%地图;在Nus宽零点上,我们达到31.1%ZSL地图;在Imagenet单一标签上,我们与Vanilla Reset50骨干骨架达到80.7%的新顶级得分,无需额外的数据或蒸馏。公共代码可在:https://github.com/alibaba-miil/ml_decoder
translated by 谷歌翻译
在分析由(X,Y)-PAIS组成的数据集中,默契假设是每对对应于相同的观察单元。然而,如果通过记录链接获得两种文件的成对,则可以在不匹配错误生根的结果中违反此假设,例如,在两个文件中缺少可靠的标识符中。最近,在这个设置下,在“混合数据”术语下,在该设置中飙升,其中通过未知的索引置换来表示(x,y)-pairs的底层正确配对。置换的显式建模往往与大量的过度装备相关联,提示需要合适的正则化方法。在本文中,我们提出了一种柔性指数家庭,以便在置换组上为此目的,可用于集成各种结构,例如稀疏和局部约束的混洗。这前结果是针对规范洗牌数据问题的缀合物,其中固定置换上的可能性条件可以在相应的(x,y)-pabes上表示为产品。推断是基于EM算法,其中富有居民算法由Fisher-yates算法近似。如果(x,y)-paess的可能性在概括的线性模型的情况下,则显示M-Step以获得从$ n ^ 2 $的大幅减少到$ n $术语。合成和实数据的比较表明,所提出的方法对竞争方法有利比较。
translated by 谷歌翻译
对于深度学习算法来量化其输出不确定性来满足可靠性约束并提供准确的结果,这一直至关重要。由于后一类任务的标准化和高度更加直接的标准输出,回归的不确定性估计比分类更少。但是,在计算机视觉中的各种应用中遇到了回归问题。我们提出了SLURP,通过侧学习者进行了一种副学习者的通用方法,该侧学习者利用了主要任务模型生成的输出和中间表示。我们在计算机视觉中的两个关键回归任务中测试SLURP:单眼深度和光学流量估计。另外,我们进行详尽的基准,包括转移到不同的数据集并添加梯度噪声。结果表明,我们的提案是通用的,随时适用于各种回归问题,并且对现有解决方案具有低计算成本。
translated by 谷歌翻译